commitsradar_fun_meter · b12397d
v5.7.0 릴리스: MLBot와 Worker의 NaN 방어 로직 강화
🤖 1258 in / 1176 out / 2434 total tokens
MLBot 생성자에 빈 actions 배열 검증을 추가하고, 학습 과정에서 발생하는 무한대나 NaN 보상을 0으로 치환하여 Q-테이블 오염을 방지합니다. runnerWorker에서 스코어 수집 및 패딩 로직에 Number.isFinite() 가드를 적용하여 계산 불가 상태를 안전
이더2026.03.021 min readv5.7.0NaN DefenseWorker